以视觉为中心的3D环境理解既是VILA的,又对自动驾驶系统充满挑战。依据,无对象的方法吸引了相当大的意义。通过预测离散体素电网的语义,但无法构建连续,准确的障碍物表面,就可以感知世界。为此,在本文中,我们提议围绕着axtingsdf,以隐式预测周围图像的连续感知的签名距离场(SDF)和语义场。具体来说,我们介绍了一种基于查询的方法,并利用了由Eikonal配方构成的SDF来准确描述障碍物的表面。此外,考虑到缺乏精确的SDF地面真相,我们提出了一个新颖的SDF监督范式,被称为三明治艾科尼尔配方,强调在表面的两边都适用于正确且密集的约束,从而增强了表面上的精度。实验表明,我们的方法可以在Nuscenes数据集上用于占用预测和3D场景重建任务的SOTA。